关于CVPR 2019投稿的一些感想
作者 | 胡国圣,英国 anyvision 高级研究员,从事深度学习,人脸识别的研究。
一年一度的 CVPR 是人工智能的机器视觉方向最重要的学术会议,每年吸引都会全球最顶尖的大学和公司的研究人员投稿,文章如果被录用,通常认为你在你的研究子方向达到了国际领先水平,是对研究人员水平的一个肯定。如果中过 CVPR 这种顶会论文,对学生找工作,老师申请项目,公司做 PR 都有很大的帮助,CVPR 论文甚至是一些 AI 初创公司估值的重要组成部分。所以,中一篇 CVPR 意义挺重大。
关于本次 CVPR 投稿简单说一下自己的看法:
1. 今年收到投稿 7100+ 篇,有效投稿 5165 篇,比去年增加 56% (图1,华刚老师的统计)。 巨大利益的推动,从业人员大增,投稿量大增,论文的在线协同编辑工具 overleaf 一度因为编辑人太多而崩溃(图2)。这种现象的背后是,国家制定人工智能战略,各大高校纷纷成立人工智能独立学院,很多原计算机学院 AI 方向的硕博名额大增。学生们纷纷转专业学 AI 考 AI,转不了专业的也在自学 AI。一群搞数学、物理、电子、机械、生物的都在转。还有一大批物理数学奥赛(国际/国家/省赛)金奖银奖选手也加入竞争。华南理工谭明奎教授评论:当硬件领域的摩尔定律逐渐因为硬件极限而失效的时候,paper 发表数量接了班(图3)。
2. 马毅老师的微博(图4)同样引起了热议:伯克利的马毅老师和六十多岁的Malik 教授为了赶 deadline,深夜和学生一起奋战,讨论论文,修改论文。
3. 大佬们生活离我远一些,那些岁数差不多的高校教师呢? 一大批青年教师,名校毕业,受过非常系统的科研训练,水平高同时又非常有责任心,非常拼命。赶论文时,跟几个青年老师简单沟通了一下,他们最后一个星期基本每天晚上睡个 3-4 个小时,然后最后一天通宵干到论文截止。
4. 学生们就不用说啦。这次跟国内老师合作的一篇论文, 我晚上下班后帮学生改论文,需要不停跟学生讨论并交互。由于 8 小时的时差,我晚上工作的时候,他在国内已经下半夜啦。我工作到 12 点, 我问学生什么时候睡。学生说,会一直陪我到我这边 12 点(国内早上 8 点)。
5. 老师学生的强度都非常大,熬夜高强度工作,以致于论文群里的深研院的彭小江老师非常严肃地分享了医生给他的心梗自救-自我心肺复苏的一些方法(图5,图6),大家这才意识到自己在玩儿命。
6. 现在论文的集团化作战现象明显,分工明确,有人找创新点,有人定方向,有人做实验,有人写论文,有人负责画图。写论文还分为有人写方法论,有人写 introduction。每个模块都有最牛逼的人做,有好几个特别牛逼的组,学生只需要提供实验结果,非常有经验的老师和博后会把文章从 0 给写完。我个人认为,培养一个研究生、博士生,你应该让他学会找点、实验和写作,搞全套科研。但现在的情况是大家都集团作战,你自己慢慢搞全套必然慢一些,很容易吃亏。
7. 这种集团化作战的结果就是,马太效应加剧,强者越强,弱者越弱。工业化大生产碾压小作坊,以个人力量对抗一个个有经验有资源的大组,结果就是小的组和闭门造车的个人发表顶级论文的可能性越来越低。
8. 这次投稿跟很多组进行了交流,有经验的组和没有经验的组的一个主要区别是时间管理的不同。有经验的组会要求学生一个月之前提交论文初稿,这样老师会有足够的时间跟学生讨论并提高论文。没有经验的组,学生提前 2-3 天完成初稿,老师跟学生累死了,论文质量还没有保证。建议老师应该给组里学生一个 hard 的截止日期,比如提前一个月,或提前 2 个星期,如果学生在那之前不能提交初稿,就要放弃那篇论文。
9. 很多老师到最后都累在帮学生写论文或改论文上,毕竟创新和实验部分前期都完成啦。大部分学生做实验都很好,但很多学生对论文写作没有系统锻炼过,论文呈现出来的逻辑简直惨不忍睹。很多老师都跟我在抱怨这个问题,一个老师直接告诉我:“看到学生的初稿后,我真是 shock 啦,彻彻底底的 shock 啦。" 我相信很多老师看到自己学生写的论文都有这个感受 :(
10. 最后给大家留个彩蛋,开心一下。我帮一个合作学生改论文时,他论文写了“improve 3 points”,我读的时候不太明白,看看表格里的数据,提升了 3%,原来他把汉语土话中的“提升了三个点”按字面意思翻译了一下。看完后, 我出去喝了一大杯水压了压惊,最后给学生起了个外号叫“三个点”。
最后的最后,祝大家 CVPR 论文高中。如果没中的话,也多放宽心,看看你竞争对手的豪华阵容。投稿前尽全力做好自己能做好的,每个细节都尽力啦,问心无愧就好啦。有幸与世界最聪明的人同台竞技,一起观看行业的风起云涌,也是我辈幸运。同时,人工智能这种增长速度和竞争强度值得每个从业者深思(不管你处于那个 Level),你如何自处,说得糙点,你如何活下来并寻求发展,占据有利位置,保住自己的位置。
#关于文中提到的分工写 paper 的现状,图森未来首席科学家王乃岩和商汤科技联合创始人林达华也发表了自己的观点。他们认为,这种流水线作业对学生成长是不利的,一个好的科研人员需要有独立做研究的能力,只有全程参与,才能成为有战斗力的生力军。
原文链接:
https://zhuanlan.zhihu.com/p/50263270
BDTC 2018
◆
精彩纷呈
◆
2018 年12月6-8 日,由中国计算机学会主办,CCF 大数据专家委员会承办,CSDN、中科天玑数据科技股份有限公司协办的 2018 中国大数据技术大会(BDTC 2018),将在北京新云南皇冠假日酒店隆重举行。
除 Keynote 外,主办方精心策划了 13 场专题技术和行业论坛,涵盖大数据分析与生态系统、深度学习、推荐系统、大数据安全与政策、大数据可视分析、精准医疗大数据、数据科学与大数据技术教育、数据库、金融大数据、知识图谱、工业大数据、区块链、交通与旅游大数据等主题。
届时,近百位技术专家及行业领袖将齐聚于此,聚焦大数据技术如何促进数字经济迅速发展,关注大数据新应用,思辨通达,深入解析热门技术在行业中的实践和落地。紧贴时代脉搏,走近数据前沿。
推荐阅读